Customer Churn em Operadoras de Telecomunicações

Autor: Erick Bernardo

Descrição geral do problema

cc03.png

Prevendo Customer Churn

Customer Churn ou Rotatividade de Clientes refere-se a decisão tomada por clientes em abandonar os serviços prestados por uma empresa, finalizando assim o relacionamento comercial entre ambos. O percentual de rotatividade de clientes complementa o percentual de fidelidade de clientes somando ambos 100%.

Empresas buscam fidelizar seus clientes, principalmente aqueles que trazem os maiores lucros para a empresa. Assim é uma vantagem comercial conseguir prever quais os clientes que possuem a maior probabilidade de encerrarem seus relacionamentos comerciais com a empresa, bem como as características de tais clientes para que políticas internas possam ser planejadas.

Neste projeto implementa-se um modelo preditivo para prever o Customer Churn de uma operadora de telecomunicações, utilizando-se a linguagem Python e um dataset disponível no Kaggle.

Importação das Bibliotecas

Informações do dataset

Dataset escolhido

O dataset foi escolhido por fornecer dados de uma grande empresa de telecomunicações envolvendo variáveis categóricas e quantitativas.

Source:

Kaggle: Telecom Churn Dataset

Data Set Information:

The Orange Telecom's Churn Dataset, which consists of cleaned customer activity data (features), along with a churn label specifying whether a customer canceled the subscription, will be used to develop predictive models. Two datasets are made available here: The churn-80 and churn-20 datasets can be downloaded.

The two sets are from the same batch, but have been split by an 80/20 ratio. As more data is often desirable for developing ML models, let's use the larger set (that is, churn-80) for training and cross-validation purposes, and the smaller set (that is, churn-20) for final testing and model performance evaluation.

Carregamento e Abertura dos Dados

O dataset escolhido já encontra-se separado em dados de treino e teste.

Treino

Teste

União dos dados

O conjunto de treino e teste foi fornecido separado, para as etapas de pré-processamento ambos conjuntos são concatenados para que sejam tratados como um único conjunto de dados.

Pré-Processamento